Web of Science
Mirosław Szreder https://orcid.org/0000-0002-7597-0816 , Krzysztof Jajuga https://orcid.org/0000-0002-5624-6929

© Mirosław Szreder, Krzysztof Jajuga. Artykuł udostępniony na licencji CC BY-SA 4.0

ARTYKUŁ

(Polski) PDF

STRESZCZENIE

Mimo upływu stu lat od ukazania się przełomowej w tamtym czasie książki Ronalda Fishera Statistical Methods for Research Workers autor pozostaje – obok Jerzego Neymana i Egona Pearsona – głównym twórcą teoretycznych podstaw wnioskowania statystycznego. Przez dziesięć dekad metody statystyczne były systematycznie wzbogacane, ale w ostatnich kilkunastu latach pojawiło się szczególnie wiele nowych wyzwań. Większe i łatwiej dostępne zbiory danych oraz narzędzia analityczne big data i sztucznej inteligencji (AI) są dla statystyków zarówno szansą, jak i sytuacją wymagającą dużej uważności.
Celem artykułu jest wskazanie i scharakteryzowanie działań, jakie powinni podjąć statystycy, aby z jednej strony pełniej wykorzystać potencjał wnioskowania statystycznego w epoce big data i AI, a z drugiej – lepiej uzmysłowić użytkownikom metod statystycznych występowanie trwałych elementów niepewności we wnioskowaniu statystycznym. Autorzy pokazują, że nieuświadomione przez część użytkowników metod statystycznych elementy niepewności tkwią nie tylko w danych, odzwierciedlających zmienność badanych zjawisk, lecz także w samym modelu wnioskowania. Stwierdzają m.in., że toczona w międzynarodowym środowisku naukowym dyskusja na temat dylematów związanych z kategorią istotności statystycznej jest konsekwencją niepełnego uwzględniania założeń modelu w praktyce wnioskowania statystycznego oraz przypisywania pojedynczemu badaniu próbkowemu rozstrzygającego znaczenia w kontekście uniwersalnych celów badania naukowego. W odniesieniu do praktyki testowania hipotez statystycznych postulują wykorzystanie podejścia bayesowskiego jako komplementarnego wobec podejścia klasycznego, którego jednym z twórców jest Fisher.

SŁOWA KLUCZOWE

wnioskowanie statystyczne, niepewność, big data, sztuczna inteligencja, AI

JEL

C10, C13, C18

BIBLIOGRAFIA

Agresti, A., Hitchcock, D. B. (2005). Bayesian inference for categorical data analysis. Statistical Methods & Applications, 14(3), 297–330. https://doi.org/10.1007/s10260-005-0121-y.

Altman, D. G. (1990). Practical Statistics for Medical Research. Chapman and Hall. https://doi.org/10.1201/9780429258589.

Amrhein, V., Greenland, S., McShane, B. (2019). Scientists rise up against statistical significance. Nature, (567), 305–307. https://doi.org/10.1038/d41586-019-00857-9.

Aven, T. (2014). Risk, Surprises and Black Swans. Fundamental Ideas and Concepts in Risk. Routledge. https://doi.org/10.4324/9781315755175.

Boctor, V. R., Coibion, O., Gorodnichenko, Y., Weber, M. (2024). On Eliciting Subjective Probability Distributions of Expectations (Working Paper 32406). National Bureau of Economic Research. https://doi.org/10.3386/w32406.

Deming, W. E. (1975). On Probability as a Basis for Action. The American Statistician, 29(4), 146–152. https://doi.org/10.1080/00031305.1975.10477402.

Denworth, L. (2019, 1 października). The Significant Problem of P Values. https://www.scientificamerican.com/article/the-significant-problem-of-p-values/.

Dittmann, P. (2006). Subjective probability in forecasting for enterprises. Management, 10(2), 89–96.

Efron, B. (1998). R. A. Fisher in the 21st Century. Statistical Science, 13(2), 95–114.

Fisher, R. (1925). Statistical Methods for Research Workers. Oliver and Boyd.

Fisher, R. (1930). Inverse Probability. Mathematical Proceedings of the Cambridge Philosophical Society, 26(4), 528–535. https://doi.org/10.1017/S0305004100016297.

Fisher, R. (1956). Statistical Methods and Scientific Inference. Oliver and Boyd.

Gelman, A. (2014). How do we choose our default methods?. W: X. Lin, C. Genest, D. L. Banks, G. Molenberghs, D. W. Scott, J.-L. Wang (red.), Past, Present, and Future of Statistical Science (s. 293–301). Routledge.

Gelman, A. (2016). The Problems With P-Values are not Just With P-Values. The American Statistician, online discussion. https://sites.stat.columbia.edu/gelman/research/published/asa_pvalues.pdf.

Gelman, A., Stern, H. (2006). The Difference Between “Significant” and “Not Significant” is not Itself Statistically Significant. The American Statistician, 60(4), 328–331. https://doi.org/10.1198/000313006X152649.

Gigerenzer, G. (1998). We need statistical thinking, not statistical rituals. Behavioral and Brain Sciences, 21(2), 199–200. https://doi.org/10.1017/S0140525X98281167.

Gigerenzer, G., Marewski, J. N. (2015). Surrogate Science: The Idol of a Universal Method for Scientific Inference. Journal of Management, 41(2), 421–440. https://doi.org/10.1177/0149206314547522.

Gould, S. J. (1985). The median isn’t the message. Discover, 6, 40–42.

Greenland, S., Senn, S. J., Rothman, K. J., Carlin, J. B., Poole, C., Goodman, S. N., Altman, D. G. (2016). Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations. European Journal of Epidemiology, 31(4), 337–350. https://doi.org/10.1007/s10654-016-0149-3.

Hurlbert, S. H., Levine, R. A., Utts, J. (2019). Coup de Grâce for a Tough Old Bull: “Statistically Significant” Expires. The American Statistician, 73(sup1), 352–357. https://doi.org/10.1080/00031305.2018.1543616.

Hurlbert, S. H., Lombardi, C. M. (2009). Final collapse of the Neyman-Pearson decision theoretic framework and rise of the neoFisherian. Annales Zoologici Fennici, 46(5), 311–349. https://doi.org/10.5735/086.046.0501.

Ioannidis, J. P. A. (2005). Why Most Published Research Findings Are False. PLoS Medicine, 2(8), e124. https://doi.org/10.1371/journal.pmed.0020124.

Jóźwiak, J., Podgórski, J. (2012). Statystyka od podstaw. Polskie Wydawnictwo Ekonomiczne.

Kelter, R. (2020). Bayesian alternatives to null hypothesis significance testing in biomedical research: a non-technical introduction to Bayesian inference with JASP. BMC Medical Research Methodology, 20, 1–12. https://doi.org/10.1186/s12874-020-00980-6.

Kowalczyk, H. (2010). O eksperckich ocenach niepewności w ankietach makroekonomicznych. Bank i Kredyt, 41(5), 101–122. https://bankikredyt.nbp.pl/content/2010/05/bik_05_2010_04_art.pdf.

Krueger, J. I., Heck, P. R. (2019). Putting the P-Value in its Place. The American Statistician, 73(sup1), 122–128. https://doi.org/10.1080/00031305.2018.1470033.

Lempert, R. (2009). The Significance of Statistical Significance: Two Authors Restate An Incontrovertible Caution. Why A Book?. Law & Social Inquiry, 34(1), 225–249. https://doi.org/10.1111/j.1747-4469.2009.01144.x.

Lenau, S., Marchetti, S., Münnich, R., Pratesi, M., Salvati, N., Shlomo, N., Schirripa Spagnolo, F., Zhang, L.-C. (2021). Methods for sampling and inference with non-probability samples. European Commission. https://ec.europa.eu/research/participants/documents/downloadPublic?documentIds=080166e5e31e26db&appId=PPGMS.

Makać, W., Urbanek-Krzysztofiak, D. (1996). Metody opisu statystycznego. Wydawnictwo Uniwersytetu Gdańskiego.

Mayer-Schönberger, V., Cukier, K. (2014). Big Data. Rewolucja, która zmieni nasze myślenie, pracę i życie. MT Biznes.

Nickerson, R. S. (2000). Null hypothesis significance testing: a review of an old and continuing controversy. Psychological Methods, 5(2), 241–301. https://doi.org/10.1037/1082-989x.5.2.241.

Pociecha, J., Jajuga, K., Szreder, M. (2024). Statistical inference and statistical learning in economic research – selected challenges. Ekonomista, (2), 138–154. https://doi.org/10.52335/ekon/188076.

Rao, C. R. (1994). Statystyka i prawda. Wydawnictwo Naukowe PWN.

Rees, D. G. (1995). Essential Statistics (wyd. 3). Chapman & Hall.

Rozeboom, W. W. (1960). The Fallacy of the Null-Hypothesis Significance Test. Psychological Bulletin, 57, 416–428.

Savage, L. J. (1976). On rereading R. A. Fisher. The Annals of Statistics, 4(3), 441–500. https://doi.org/10.1214/aos/1176343456.

Shadish, W. R., Cook, T. D. (1999). Comment – Design Rules: More Steps Toward a Complete Theory of Quasi-experimentation. Statistical Science, 14(3), 294–300.

Siegfried, T. (2010, 12 marca). Odds Are, It’s Wrong: Science Fails to Face the Shortcomings of Statistics. Science News. https://www.sciencenews.org/article/odds-are-its-wrong.

Silver, N. (2012). The Signal and the Noise. The Art and Science of Prediction. Penguin Books.

Spence, J. R., Stanley, D. J. (2018). Concise, Simple, and Not Wrong: In Search of a Short-Hand Interpretation of Statistical Significance. Frontiers in Psychology, 9, 1–5. https://doi.org/10.3389/fpsyg.2018.02185.

Spotfire Blogging Team. (2011, 13 października). Using Predictive Analytics to Fight Crime. https://www.tibco.com/blog/2011/10/13/using-predictive-analytics-to-fight-crime/.

Steinhaus, H. (1953). Prawdopodobieństwo, wiarygodność i możliwość. Applicationes Mathematicae, 1(3), 149–172.

Szreder, M. (2022). Szanse i iluzje dotyczące korzystania z dużych prób we wnioskowaniu statystycznym. Wiadomości Statystyczne. The Polish Statistician, 67(8), 1–16. https://doi.org/10.5604/01.3001.0015.9704.

Szreder, M. (2024). Próba reprezentatywna – potrzeba i propozycja definicji. Wiadomości Statystyczne. The Polish Statistician, 69(11), 54–68. https://doi.org/10.59139/ws.2024.11.4.

Szreder, M., Kozłowski, A. (2024). Wnioskowanie na podstawie prób losowych i nielosowych. Wydawnictwo Uniwersytetu Gdańskiego.

Szucs, D., Ioannidis, J. P. A. (2017). When Null Hypothesis Significance Testing Is Unsuitable for Research: A Reassessment. Frontiers in Human Neuroscience, 11(3), 1–21. https://doi.org/10.3389/fnhum.2017.00390.

Trafimow, D. (2014). Editorial. Basic and Applied Social Psychology, 36(1), 1–2. https://doi.org/10.1080/01973533.2014.865505.

Wasserstein, R. L., Lazar, N. A. (2016). The ASA’s Statement on p-Values: Context, Process, and Purpose. The American Statistician, 70(2), 129–133. https://doi.org/10.1080/00031305.2016.1154108.

Wasserstein, R. L., Schirm, A. L., Lazar, N. A. (2019). Moving to a World Beyond “???? < 0.05”. The American Statistician, 73(sup1), 1–19. https://doi.org/10.1080/00031305.2019.1583913.

Zardetto, D. (2015). The implication of Big Data for Official Statistics. Eurostat. https://circabc.europa.eu/sd/a/c35f00b3-3103-4873-a5a8-68386822af03/DAY%201_ITEM%202_The%20implication%20of%20big%20data.pdf.

Do góry
© 2019-2022 Copyright by Główny Urząd Statystyczny, pewne prawa zastrzeżone. Licencja Creative Commons Uznanie autorstwa - Na tych samych warunkach 4.0 (CC BY-SA 4.0) Creative Commons — Attribution-ShareAlike 4.0 International — CC BY-SA 4.0